home *** CD-ROM | disk | FTP | other *** search
/ PC World Komputer 2003 November A / PCWK1103A.iso / Adobe After Effects 6.0 tryout / MM4.Cab / F3605_DEVANAGA.TXT.942461E0_7FE8_440B_86B6_AA6592C2EC51 < prev    next >
Text File  |  2003-03-20  |  15KB  |  399 lines

  1. ##Adobe File Version: 1.000
  2. #=======================================================================
  3. #   FTP file name:  DEVANAGA.TXT
  4. #
  5. #   Contents:       Map (external version) from Mac OS Devanagari
  6. #                   encoding to Unicode 2.1
  7. #
  8. #   Copyright:      (c) 1995-1999 by Apple Computer, Inc., all rights
  9. #                   reserved.
  10. #
  11. #   Contact:        charsets@apple.com
  12. #
  13. #   Changes:
  14. #
  15. #       b02  1999-Sep-22    Update contact e-mail address. Matches
  16. #                           internal utom<b1>, ufrm<b1>, and Text
  17. #                           Encoding Converter version 1.5.
  18. #       n04  1998-Feb-05    First version; matches internal utom<n9>,
  19. #                           ufrm<n15>.
  20. #
  21. # Standard header:
  22. # ----------------
  23. #
  24. #   Apple, the Apple logo, and Macintosh are trademarks of Apple
  25. #   Computer, Inc., registered in the United States and other countries.
  26. #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
  27. #   throughout this document, "Macintosh" can be used to refer to
  28. #   Macintosh computers and "Unicode" can be used to refer to the
  29. #   Unicode standard.
  30. #
  31. #   Apple makes no warranty or representation, either express or
  32. #   implied, with respect to these tables, their quality, accuracy, or
  33. #   fitness for a particular purpose. In no event will Apple be liable
  34. #   for direct, indirect, special, incidental, or consequential damages 
  35. #   resulting from any defect or inaccuracy in this document or the
  36. #   accompanying tables.
  37. #
  38. #   These mapping tables and character lists are subject to change.
  39. #   The latest tables should be available from the following:
  40. #
  41. #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
  42. #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
  43. #
  44. #   For general information about Mac OS encodings and these mapping
  45. #   tables, see the file "README.TXT".
  46. #
  47. # Format:
  48. # -------
  49. #
  50. #   Three tab-separated columns;
  51. #   '#' begins a comment which continues to the end of the line.
  52. #     Column #1 is the Mac OS Devanagari code or code sequence
  53. #       (in hex as 0xNN or 0xNN+0xNN)
  54. #     Column #2 is the corresponding Unicode or Unicode sequence
  55. #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
  56. #     Column #3 is a comment containing the Unicode name or sequence
  57. #       of names. In some cases an additional comment follows the
  58. #       Unicode name(s).
  59. #
  60. #   The entries are in two sections. The first section is for pairs of
  61. #   Mac OS Devanagari code points that must be mapped in a special way.
  62. #   The second section maps individual code points.
  63. #
  64. #   Within each section, the entries are in Mac OS Devanagari code order.
  65. #
  66. #   Control character mappings are not shown in this table, following
  67. #   the conventions of the standard UTC mapping tables. However, the
  68. #   Mac OS Devanagari character set uses the standard control characters
  69. #   at 0x00-0x1F and 0x7F.
  70. #
  71. # Notes on Mac OS Devanagari:
  72. # ---------------------------
  73. #
  74. #   Mac OS Devanagari is based on IS 13194:1991 (ISCII-91), with the
  75. #   addition of several punctuation and symbol characters. However,
  76. #   Mac OS Devanagari does not support the ATR (attribute) mechanism of
  77. #   ISCII-91.
  78. #
  79. # 1. ISCII-91 features in Mac OS Devanagari include:
  80. #
  81. #  a) Overloading of nukta
  82. #
  83. #     In addition to using the nukta (0xE9) like a combining dot below,
  84. #     nukta is overloaded to function as a general character modifier.
  85. #     In this role, certain code points followed by 0xE9 are treated as
  86. #     a two-byte code point representing a character which may be
  87. #     rather different than the characters represented by either of
  88. #     the code points alone. For example, the character DEVANAGARI OM
  89. #     (U+0950) is represented in ISCII-91 as candrabindu + nukta.
  90. #
  91. #  b) Explicit halant and soft halant
  92. #
  93. #     A double halant (0xE8 + 0xE8) constitutes an "explicit halant",
  94. #     which will always appear as a halant instead of causing formation
  95. #     of a ligature or half-form consonant.
  96. #
  97. #     Halant followed by nukta (0xE8 + 0xE9) constitutes a "soft
  98. #     halant", which prevents formation of a ligature and instead
  99. #     retains the half-form of the first consonant.
  100. #
  101. #  c) Invisible consonant
  102. #
  103. #     The byte 0xD9 (called INV in ISCII-91) is an invisible consonant:
  104. #     It behaves like a consonant but has no visible appearance. It is
  105. #     intended to be used (often in combination with halant) to display
  106. #     dependent forms in isolation, such as the RA forms or consonant
  107. #     half-forms.
  108. #
  109. #  d) Extensions for Vedic, etc.
  110. #
  111. #     The byte 0xF0 (called EXT in ISCII-91) followed by any byte in
  112. #     the range 0xA1-0xEE constitutes a two-byte code point which can
  113. #     be used to represent additional characters for Vedic (or other
  114. #     extensions); 0xF0 followed by any other byte value constitutes
  115. #     malformed text. Mac OS Devanagari supports this mechanism, but
  116. #     does not currently map any of these two-byte code points to
  117. #     anything.
  118. #
  119. # 2. Mac OS Devanagari additions
  120. #
  121. #   Mac OS Devanagari adds characters using the code points
  122. #   0x80-0x8A and 0x90-0x91 (the latter are some Devanagari additions
  123. #   from Unicode).
  124. #
  125. # 3. Unused code points
  126. #   
  127. #   The following code points are currently unused, and are not shown
  128. #   here: 0x8B-0x8F, 0x92-0xA0, 0xEB-0xEF, 0xFB-0xFF. In addition,
  129. #   0xF0 is not shown here, but it has a special function as described
  130. #   above.
  131. #
  132. # Unicode mapping issues and notes:
  133. # ---------------------------------
  134. #
  135. # 1. Mapping the byte pairs
  136. #
  137. #   If one of the following byte values is encountered when mapping
  138. #   Mac OS Devanagari text - 0xA1, 0xA6, 0xA7, 0xAA, 0xDB, 0xDC, 0xDF,
  139. #   0xE8, or 0xEA - then the next byte (if there is one) should be
  140. #   examined. If the next byte is 0xE9 - or also 0xE8, if the first
  141. #   byte was 0xE8 - then the byte pair should be mapped using the
  142. #   first section of the mapping table below. Otherwise, each byte
  143. #   should be mapped using the second section of the mapping table
  144. #   below.
  145. #
  146. #   - The Unicode Standard, Version 2.0, specifies how explicit
  147. #     halant and soft halant should be represented in Unicode;
  148. #     these mappings are used below.
  149. #
  150. #   If the byte value 0xF0 is encountered when mapping Mac OS 
  151. #   Devanagari text, then the next byte should be examined. If there
  152. #   is no next byte (e.g. 0xF0 at end of buffer), the mapping
  153. #   process should indicate incomplete character. If there is a next
  154. #   byte but it is not in the range 0xA1-0xEE, the mapping process
  155. #   should indicate malformed text. Otherwise, the mapping process
  156. #   should treat the byte pair as a valid two-byte code point with no
  157. #   mapping (e.g. map it to QUESTION MARK, REPLACEMENT CHARACTER,
  158. #   etc.).
  159. #
  160. # 2. Mapping the invisible consonant
  161. #
  162. #   It has been suggested that INV in ISCII-91 should map to ZERO
  163. #   WIDTH NON-JOINER in Unicode. However, this causes problems with
  164. #   roundtrip fidelity: The ISCII-91 sequences 0xE8+0xE8 and 0xE8+0xD9
  165. #   would map to the same sequence of Unicode characters. We have
  166. #   instead mapped INV to LEFT-TO-RIGHT MARK, which avoids these
  167. #   problems.
  168. #
  169. # 3. Additional loose mappings from Unicode
  170. #
  171. #   These are not preserved in roundtrip mappings.
  172. #
  173. #   U+0958  0xB3+0xE9  # DEVANAGARI LETTER QA
  174. #   U+0959  0xB4+0xE9  # DEVANAGARI LETTER KHHA
  175. #   U+095A  0xB5+0xE9  # DEVANAGARI LETTER GHHA
  176. #   U+095B  0xBA+0xE9  # DEVANAGARI LETTER ZA
  177. #   U+095C  0xBF+0xE9  # DEVANAGARI LETTER DDDHA
  178. #   U+095D  0xC0+0xE9  # DEVANAGARI LETTER RHA
  179. #   U+095E  0xC9+0xE9  # DEVANAGARI LETTER FA
  180. #
  181. # Details of mapping changes in each version:
  182. # -------------------------------------------
  183. #
  184. ##################
  185.  
  186. # Section 1: Map the following byte pairs as indicated:
  187. # (ZWNJ means ZERO WIDTH NON-JOINER, ZWJ means ZERO WIDTH JOINER)
  188. # (Also see note about 0xF0 in comments above)
  189.  
  190. 0xA1+0xE9    0x0950    # DEVANAGARI OM
  191. 0xA6+0xE9    0x090C    # DEVANAGARI LETTER VOCALIC L
  192. 0xA7+0xE9    0x0961    # DEVANAGARI LETTER VOCALIC LL
  193. 0xAA+0xE9    0x0960    # DEVANAGARI LETTER VOCALIC RR
  194. 0xDB+0xE9    0x0962    # DEVANAGARI VOWEL SIGN VOCALIC L
  195. 0xDC+0xE9    0x0963    # DEVANAGARI VOWEL SIGN VOCALIC LL
  196. 0xDF+0xE9    0x0944    # DEVANAGARI VOWEL SIGN VOCALIC RR
  197. 0xE8+0xE8    0x094D+0x200C    # DEVANAGARI SIGN VIRAMA + ZWNJ    # explicit halant
  198. 0xE8+0xE9    0x094D+0x200D    # DEVANAGARI SIGN VIRAMA + ZWJ    # soft halant
  199. 0xEA+0xE9    0x093D    # DEVANAGARI SIGN AVAGRAHA
  200.  
  201. # Section 2: Map the remaining bytes as follows:
  202.  
  203. 0x20    0x0020    # SPACE
  204. 0x21    0x0021    # EXCLAMATION MARK
  205. 0x22    0x0022    # QUOTATION MARK
  206. 0x23    0x0023    # NUMBER SIGN
  207. 0x24    0x0024    # DOLLAR SIGN
  208. 0x25    0x0025    # PERCENT SIGN
  209. 0x26    0x0026    # AMPERSAND
  210. 0x27    0x0027    # APOSTROPHE
  211. 0x28    0x0028    # LEFT PARENTHESIS
  212. 0x29    0x0029    # RIGHT PARENTHESIS
  213. 0x2A    0x002A    # ASTERISK
  214. 0x2B    0x002B    # PLUS SIGN
  215. 0x2C    0x002C    # COMMA
  216. 0x2D    0x002D    # HYPHEN-MINUS
  217. 0x2E    0x002E    # FULL STOP
  218. 0x2F    0x002F    # SOLIDUS
  219. 0x30    0x0030    # DIGIT ZERO
  220. 0x31    0x0031    # DIGIT ONE
  221. 0x32    0x0032    # DIGIT TWO
  222. 0x33    0x0033    # DIGIT THREE
  223. 0x34    0x0034    # DIGIT FOUR
  224. 0x35    0x0035    # DIGIT FIVE
  225. 0x36    0x0036    # DIGIT SIX
  226. 0x37    0x0037    # DIGIT SEVEN
  227. 0x38    0x0038    # DIGIT EIGHT
  228. 0x39    0x0039    # DIGIT NINE
  229. 0x3A    0x003A    # COLON
  230. 0x3B    0x003B    # SEMICOLON
  231. 0x3C    0x003C    # LESS-THAN SIGN
  232. 0x3D    0x003D    # EQUALS SIGN
  233. 0x3E    0x003E    # GREATER-THAN SIGN
  234. 0x3F    0x003F    # QUESTION MARK
  235. 0x40    0x0040    # COMMERCIAL AT
  236. 0x41    0x0041    # LATIN CAPITAL LETTER A
  237. 0x42    0x0042    # LATIN CAPITAL LETTER B
  238. 0x43    0x0043    # LATIN CAPITAL LETTER C
  239. 0x44    0x0044    # LATIN CAPITAL LETTER D
  240. 0x45    0x0045    # LATIN CAPITAL LETTER E
  241. 0x46    0x0046    # LATIN CAPITAL LETTER F
  242. 0x47    0x0047    # LATIN CAPITAL LETTER G
  243. 0x48    0x0048    # LATIN CAPITAL LETTER H
  244. 0x49    0x0049    # LATIN CAPITAL LETTER I
  245. 0x4A    0x004A    # LATIN CAPITAL LETTER J
  246. 0x4B    0x004B    # LATIN CAPITAL LETTER K
  247. 0x4C    0x004C    # LATIN CAPITAL LETTER L
  248. 0x4D    0x004D    # LATIN CAPITAL LETTER M
  249. 0x4E    0x004E    # LATIN CAPITAL LETTER N
  250. 0x4F    0x004F    # LATIN CAPITAL LETTER O
  251. 0x50    0x0050    # LATIN CAPITAL LETTER P
  252. 0x51    0x0051    # LATIN CAPITAL LETTER Q
  253. 0x52    0x0052    # LATIN CAPITAL LETTER R
  254. 0x53    0x0053    # LATIN CAPITAL LETTER S
  255. 0x54    0x0054    # LATIN CAPITAL LETTER T
  256. 0x55    0x0055    # LATIN CAPITAL LETTER U
  257. 0x56    0x0056    # LATIN CAPITAL LETTER V
  258. 0x57    0x0057    # LATIN CAPITAL LETTER W
  259. 0x58    0x0058    # LATIN CAPITAL LETTER X
  260. 0x59    0x0059    # LATIN CAPITAL LETTER Y
  261. 0x5A    0x005A    # LATIN CAPITAL LETTER Z
  262. 0x5B    0x005B    # LEFT SQUARE BRACKET
  263. 0x5C    0x005C    # REVERSE SOLIDUS
  264. 0x5D    0x005D    # RIGHT SQUARE BRACKET
  265. 0x5E    0x005E    # CIRCUMFLEX ACCENT
  266. 0x5F    0x005F    # LOW LINE
  267. 0x60    0x0060    # GRAVE ACCENT
  268. 0x61    0x0061    # LATIN SMALL LETTER A
  269. 0x62    0x0062    # LATIN SMALL LETTER B
  270. 0x63    0x0063    # LATIN SMALL LETTER C
  271. 0x64    0x0064    # LATIN SMALL LETTER D
  272. 0x65    0x0065    # LATIN SMALL LETTER E
  273. 0x66    0x0066    # LATIN SMALL LETTER F
  274. 0x67    0x0067    # LATIN SMALL LETTER G
  275. 0x68    0x0068    # LATIN SMALL LETTER H
  276. 0x69    0x0069    # LATIN SMALL LETTER I
  277. 0x6A    0x006A    # LATIN SMALL LETTER J
  278. 0x6B    0x006B    # LATIN SMALL LETTER K
  279. 0x6C    0x006C    # LATIN SMALL LETTER L
  280. 0x6D    0x006D    # LATIN SMALL LETTER M
  281. 0x6E    0x006E    # LATIN SMALL LETTER N
  282. 0x6F    0x006F    # LATIN SMALL LETTER O
  283. 0x70    0x0070    # LATIN SMALL LETTER P
  284. 0x71    0x0071    # LATIN SMALL LETTER Q
  285. 0x72    0x0072    # LATIN SMALL LETTER R
  286. 0x73    0x0073    # LATIN SMALL LETTER S
  287. 0x74    0x0074    # LATIN SMALL LETTER T
  288. 0x75    0x0075    # LATIN SMALL LETTER U
  289. 0x76    0x0076    # LATIN SMALL LETTER V
  290. 0x77    0x0077    # LATIN SMALL LETTER W
  291. 0x78    0x0078    # LATIN SMALL LETTER X
  292. 0x79    0x0079    # LATIN SMALL LETTER Y
  293. 0x7A    0x007A    # LATIN SMALL LETTER Z
  294. 0x7B    0x007B    # LEFT CURLY BRACKET
  295. 0x7C    0x007C    # VERTICAL LINE
  296. 0x7D    0x007D    # RIGHT CURLY BRACKET
  297. 0x7E    0x007E    # TILDE
  298. #
  299. 0x80    0x00D7    # MULTIPLICATION SIGN
  300. 0x81    0x2212    # MINUS SIGN
  301. 0x82    0x2013    # EN DASH
  302. 0x83    0x2014    # EM DASH
  303. 0x84    0x2018    # LEFT SINGLE QUOTATION MARK
  304. 0x85    0x2019    # RIGHT SINGLE QUOTATION MARK
  305. 0x86    0x2026    # HORIZONTAL ELLIPSIS
  306. 0x87    0x2022    # BULLET
  307. 0x88    0x00A9    # COPYRIGHT SIGN
  308. 0x89    0x00AE    # REGISTERED SIGN
  309. 0x8A    0x2122    # TRADE MARK SIGN
  310. #
  311. 0x90    0x0965    # DEVANAGARI DOUBLE DANDA
  312. 0x91    0x0970    # DEVANAGARI ABBREVIATION SIGN
  313. #
  314. 0xA1    0x0901    # DEVANAGARI SIGN CANDRABINDU
  315. 0xA2    0x0902    # DEVANAGARI SIGN ANUSVARA
  316. 0xA3    0x0903    # DEVANAGARI SIGN VISARGA
  317. 0xA4    0x0905    # DEVANAGARI LETTER A
  318. 0xA5    0x0906    # DEVANAGARI LETTER AA
  319. 0xA6    0x0907    # DEVANAGARI LETTER I
  320. 0xA7    0x0908    # DEVANAGARI LETTER II
  321. 0xA8    0x0909    # DEVANAGARI LETTER U
  322. 0xA9    0x090A    # DEVANAGARI LETTER UU
  323. 0xAA    0x090B    # DEVANAGARI LETTER VOCALIC R
  324. 0xAB    0x090E    # DEVANAGARI LETTER SHORT E
  325. 0xAC    0x090F    # DEVANAGARI LETTER E
  326. 0xAD    0x0910    # DEVANAGARI LETTER AI
  327. 0xAE    0x090D    # DEVANAGARI LETTER CANDRA E
  328. 0xAF    0x0912    # DEVANAGARI LETTER SHORT O
  329. 0xB0    0x0913    # DEVANAGARI LETTER O
  330. 0xB1    0x0914    # DEVANAGARI LETTER AU
  331. 0xB2    0x0911    # DEVANAGARI LETTER CANDRA O
  332. 0xB3    0x0915    # DEVANAGARI LETTER KA
  333. 0xB4    0x0916    # DEVANAGARI LETTER KHA
  334. 0xB5    0x0917    # DEVANAGARI LETTER GA
  335. 0xB6    0x0918    # DEVANAGARI LETTER GHA
  336. 0xB7    0x0919    # DEVANAGARI LETTER NGA
  337. 0xB8    0x091A    # DEVANAGARI LETTER CA
  338. 0xB9    0x091B    # DEVANAGARI LETTER CHA
  339. 0xBA    0x091C    # DEVANAGARI LETTER JA
  340. 0xBB    0x091D    # DEVANAGARI LETTER JHA
  341. 0xBC    0x091E    # DEVANAGARI LETTER NYA
  342. 0xBD    0x091F    # DEVANAGARI LETTER TTA
  343. 0xBE    0x0920    # DEVANAGARI LETTER TTHA
  344. 0xBF    0x0921    # DEVANAGARI LETTER DDA
  345. 0xC0    0x0922    # DEVANAGARI LETTER DDHA
  346. 0xC1    0x0923    # DEVANAGARI LETTER NNA
  347. 0xC2    0x0924    # DEVANAGARI LETTER TA
  348. 0xC3    0x0925    # DEVANAGARI LETTER THA
  349. 0xC4    0x0926    # DEVANAGARI LETTER DA
  350. 0xC5    0x0927    # DEVANAGARI LETTER DHA
  351. 0xC6    0x0928    # DEVANAGARI LETTER NA
  352. 0xC7    0x0929    # DEVANAGARI LETTER NNNA
  353. 0xC8    0x092A    # DEVANAGARI LETTER PA
  354. 0xC9    0x092B    # DEVANAGARI LETTER PHA
  355. 0xCA    0x092C    # DEVANAGARI LETTER BA
  356. 0xCB    0x092D    # DEVANAGARI LETTER BHA
  357. 0xCC    0x092E    # DEVANAGARI LETTER MA
  358. 0xCD    0x092F    # DEVANAGARI LETTER YA
  359. 0xCE    0x095F    # DEVANAGARI LETTER YYA
  360. 0xCF    0x0930    # DEVANAGARI LETTER RA
  361. 0xD0    0x0931    # DEVANAGARI LETTER RRA
  362. 0xD1    0x0932    # DEVANAGARI LETTER LA
  363. 0xD2    0x0933    # DEVANAGARI LETTER LLA
  364. 0xD3    0x0934    # DEVANAGARI LETTER LLLA
  365. 0xD4    0x0935    # DEVANAGARI LETTER VA
  366. 0xD5    0x0936    # DEVANAGARI LETTER SHA
  367. 0xD6    0x0937    # DEVANAGARI LETTER SSA
  368. 0xD7    0x0938    # DEVANAGARI LETTER SA
  369. 0xD8    0x0939    # DEVANAGARI LETTER HA
  370. 0xD9    0x200E    # LEFT-TO-RIGHT MARK    # invisible consonant
  371. 0xDA    0x093E    # DEVANAGARI VOWEL SIGN AA
  372. 0xDB    0x093F    # DEVANAGARI VOWEL SIGN I
  373. 0xDC    0x0940    # DEVANAGARI VOWEL SIGN II
  374. 0xDD    0x0941    # DEVANAGARI VOWEL SIGN U
  375. 0xDE    0x0942    # DEVANAGARI VOWEL SIGN UU
  376. 0xDF    0x0943    # DEVANAGARI VOWEL SIGN VOCALIC R
  377. 0xE0    0x0946    # DEVANAGARI VOWEL SIGN SHORT E
  378. 0xE1    0x0947    # DEVANAGARI VOWEL SIGN E
  379. 0xE2    0x0948    # DEVANAGARI VOWEL SIGN AI
  380. 0xE3    0x0945    # DEVANAGARI VOWEL SIGN CANDRA E
  381. 0xE4    0x094A    # DEVANAGARI VOWEL SIGN SHORT O
  382. 0xE5    0x094B    # DEVANAGARI VOWEL SIGN O
  383. 0xE6    0x094C    # DEVANAGARI VOWEL SIGN AU
  384. 0xE7    0x0949    # DEVANAGARI VOWEL SIGN CANDRA O
  385. 0xE8    0x094D    # DEVANAGARI SIGN VIRAMA    # halant
  386. 0xE9    0x093C    # DEVANAGARI SIGN NUKTA
  387. 0xEA    0x0964    # DEVANAGARI DANDA
  388. #
  389. 0xF1    0x0966    # DEVANAGARI DIGIT ZERO
  390. 0xF2    0x0967    # DEVANAGARI DIGIT ONE
  391. 0xF3    0x0968    # DEVANAGARI DIGIT TWO
  392. 0xF4    0x0969    # DEVANAGARI DIGIT THREE
  393. 0xF5    0x096A    # DEVANAGARI DIGIT FOUR
  394. 0xF6    0x096B    # DEVANAGARI DIGIT FIVE
  395. 0xF7    0x096C    # DEVANAGARI DIGIT SIX
  396. 0xF8    0x096D    # DEVANAGARI DIGIT SEVEN
  397. 0xF9    0x096E    # DEVANAGARI DIGIT EIGHT
  398. 0xFA    0x096F    # DEVANAGARI DIGIT NINE
  399.